flowchart TD
a --> b
Estimación de default mediante modelos de machine learning
Organizadora: Natalia Salaberry
CIMBAGE (IADCOM) - Facultad Ciencias Económicas (UBA)
2024-05-13
flowchart TD
a --> b
Procesamiento de datos:
📦 pandas==2.2.1
📦 numpy==1.26.4
Modelado:
📦 scikit-learn==1.3.0
Visualización y tablas:
📦 matplotlib==3.8.0
📦 seaborn==0.12.2
📦 great_tables==0.5.0
Siendo \(N\) la cantidad de observaciones, \(y_i\) el valor observado para la obseravción \(i\) y \(\hat{y_i}\) el valor predicho para la observación \(i\), se definen las funciones de pérdida:
También denominada Negative Mean Log-Likelihood
\[ \text{Log Loss} = -\frac{1}{N} \sum_{i=1}^{N} \left( \color{red}{y_i \log(\hat{y_i})} + \color{blue}{(1 - y_i) \log(1 - \hat{y_i})} \right) \]
Si \(y_i=1\) => \(\text{Log Loss}=\color{red}{\log(\hat{y_i})}\)
Si \(y_i=0\) => \(\text{Log Loss}=\color{blue}{\log(1 - \hat{y_i})}\)
Error Cuadrático Medio pero para clasificación:
\[ \text{Brier Loss} = \frac{1}{N} \sum_{i=1}^{N} (y_i - \hat{y_i})^2 \]
Un texto para probar el tamaño del texto!
| a | b |
| 1 | a |
| 2 | b |
| 3 | c |
?@tbl-a es una tabla y ?@tbl-b es otra